Praca domowa 2

Maciej Gryszkiewicz

Import niezbędnych modułów

Wczytanie ramki danych

Ze względu na restrykcje XGBoosta, który wymaga aby w nazwie zmiennych nie było znaków ">", "<" należy zmienić nazwę jednej kolummy.

Wczytanie modelu XGBoost

Przygotowanie pierwszego rekordu do dekompozycji

Wyliczenie predykowanej przez model wartości.

Przygotowanie instancji Explainera i narysowanie wykresów dla każdej dekompozycji

Najbardziej istotne dla modelu są zmienne opisujące położenie nieruchomości oraz zarobki mieszkańców. W 4 z 6 powyższych obserwacji najistotniejszą zmienną jest median_income. \ \ Oprócz tego, widzimy, że dla wartości zmiennej median_income z tego samego przedziału (np. w observation2 i observation3 zmienna median_income jest w przedziale '<= 0.14') wpływ tej zmiennej na końcowy wynik predykcji jest niemalże identyczny dla obydwu tych obserwacji. Podobnie jest ze zmienną INLAND, w przypadku gdy jest równa 0, model podnosi przewidywaną cenę domu o ok. 57000, a gdy zmienna przyjmuje wartość 1 model opszucza przewidywaną cenę o ok. 56000.\ Zjawisko to jest obecne również w pozostałych zmiennych. \ \ Wobec tego, metoda LIME wydaję się być dość stabilna oraz poprawnie określać wpływ poszczególnych zmiennych na predykcję.